查看原文
其他

张鹏对谈王俊煜、李志飞:ChatGPT 插件模式会如何颠覆互联网格局?

Founder Park Founder Park 2023-04-19

3 月 23 日,OpenAI 宣布计划推出 Plugins 插件以「帮助 ChatGPT 访问最新信息、运行计算或使用第三方服务」。插件可以显著增强自然语言处理能力,使其与用户的交流更加有效。拥有了插件之后,本来作为演示产品而存在的 ChatGPT 突然成为了一个面向普通消费者的服务平台,很多商业落地场景有了新的想象,甚至于不少传统互联网巨头的业务模式都受到了新的挑战,这会是互联网巨头的「诸神黄昏」吗?

搜索引擎的形态会如何变化,还会是具有核心商业价值的产品吗?以及,如果 OpenAI 之后,其他大模型应该怎么走?关于这些问题,Founder Park 组织了一场圆桌讨论,由极客公园创始人&总裁张鹏主持,阅览室、豌豆荚创始人王俊煜,以及出门问问创始人李志飞参与了这场讨论。

注:圆桌讨论时间为 3 月 31 日,ChatGPT 发布插件功能后。


01

ChatGPT 的 Plugins,

如何颠覆传统搜索

张鹏:如何看待ChatGPT新发布的 Plugins?

李志飞:我觉得它最神奇的地方在于用户不需要做任何事情,就可以奇迹般地提供答案。谷歌的垂直搜索引擎 OneBox 操作起来首先要把领域加进去,然后标很多语义数据,再定义一个语义模板,这样放到个人系统里面去训练,整个一个闭环才能实现自然语言和机器的交流。而 Plugins 省去了所有这些步骤,只要能把网站的信息提供总计好给它,它就可以直接出来 OneBox 一系列操作才能呈现出来的结果。也就是说它是一个通用的语义解析器,不需要提前定义语义模板,也不需要标注数据,就可以做到这种插入(plug in)

张鹏:这样看来,ChatGPT 不只是一个对话工具,我们也可以把它拆开做对应组合来延展它的应用。而且这种插件本身构造难度也很低,可以让很多人受益。

王俊煜:首先先澄清一下,我最近看到一个说法,是说插件的制作过程是可以跟 ChatGPT 的交互来完全自动化完成的,就是自己给自己写插件,但目前来说这个还没有实现。我觉得插件更神奇的是,相对于大模型来说,它能够知道什么时候来调用。我之所以认为这个功能很神奇不是说从技术角度,而是说从产品角度。

我在这从头说说这个插件到底是什么机制。首先有一个在线服务,然后有一个接口。OpenAI 的创始人说是要给自然语言模型写一个API文档*。我想提醒大家注意的是,不是说我们可以用自然语言写文档,而是还要用文档格式写文档,也就是还是要代码语言。然后把 manifest*给ChatGPT理论上就能够通过 API 调用,我觉得这个是很神奇的。之前我们用伪程序员 Postman*这种工具虽然也能知道如何通过 API 发出一个请求,但其实还是有些麻烦。而且还要理解不同 API 的 end point 的不同参数是什么意思。ChatGPT 宣称可以自行理解这些文档,只要文档写得够清楚。

*API 文档: API 文档或 API 描述文档是帮助开发人员使用您的 API 的参考资料、教程和示例的集合。API 的文档是解释 API 的可能性以及如何开始的主要资源。
*manifest(清单):是唯一标识程序集的 XML 文档。它包含用于绑定和激活的信息,例如 COM 类、接口和类型库。清单可以是外部 XML 文件或嵌入在应用程序或程序集中的资源。

*postman:一个用于构建和使用 API 的平台

从流量分发角度来讲插件也是很神奇的一件事情。之前我们做 SEO,哪些结果排在前面是由搜索引擎决定的,然后用户再来做决策。但是 ChatGPT的插件机制就由它来替用户做选择。现在因为还有一些数量限制,导致体验可能要打一些折扣,我相信未来这些限制去掉以后,体验会越来越神奇。因为这相当于 ChatGPT 猜测用户意图,而且这个意图是 ChatGPT 通过用户的自然语言去判断用 A 服务还是 B 服务满足。本质上是只要给 ChatGPT 一个 API,告诉 ChatGPT API 是做什么的,怎么调用、什么时候调用、返回的结果怎么理解,这些都是自动化完成的。

ChatGPT 插件演示 | 来源:OpenAI 官网

我对于插件,还有之前 ChatGPT 进入市场(go to market)的能力也是非常惊叹的。在这么短的时间里要做出一个如此成果的模型(demo),再加上这么快速的迭代,本身是只有非常优秀的产品经理才能做出来的。而且插件有 limited beta、close beta、自选 3 个插件等等这些限制,也是发布节奏把控非常好的一种表现。因为肯定还是会有一些问题需要之后更成熟的方案,在这个方案发布后这些限制才能解除。从产品经理的角度看,这些产品发布的节奏把握可以说恰到好处,实际说这些产品发布初期都是很粗糙的,但又刚刚好是 demo 的东西,能达到初期目标。

张鹏:ChatGPT的插件未来可能是一个集内容生产,搜索,推荐于一体的「怪胎」,如何看待插件能力的演进?

李志飞:毫无疑问,ChatGPT的插件相比 Google Assistant,Siri 来说,在服务接口,标注数据,训练系统,自然语言等等方面都是具有领先式的先进性。但在自然语言这块我有一个担心,就是说它本身是有歧义的,插件在这块的表现我觉得还有待观察。在我看来 ChatGPT插件真正新颖之处在于它有一个非常通用的自然语言处理的机制。

传统搜索引擎只能检索被生产出来的内容,然后推荐也是因为用户之前一些关注和搜索历史来形成推荐。也就是说,从内容制作到内容分发,都是不同的渠道和方式。而 ChatGPT 本身就是一个生成内容的平台,然后用户问问题时就可以直接索引 ChatGPT 生产的内容。而且用得越多,它就会对推荐序列形成一个超级理解,这样 ChatGPT 变成了一个非常懂用户需求,把内容生产和消费内容合一的平台


02

Plugins 从理念到落地,

互联网与搜索引擎变革的新可能

张鹏:GPT 插件使得每个人,每个组织的数字化能力都被加强了,它可以帮助人们用自然语言或者相对更简单的方式实现数字化。那么这会不会对未来的流量分发、资源聚集产生一些影响,甚至对现有互联网的格局做出根本性的改变?

王俊煜:我觉得在当前人类社会的商业模式下,有一个因素在这里讨论时是不能被忽视的,那就是品牌。一些时候如果只是需要一些很简单的需求,也就是所谓的 white label,放在搜索引擎的维度,就是说搜索引擎或者某个中间层直接帮你决定了答案也没有任何感觉。但其他时候,我们需要品牌的口碑帮我们做出更优的选择,并且可能对某个品牌的信任会让我们的习惯固定下来,用户和品牌之间形成了一个约定的关系。

另外,我觉得 OpenAI 和它的初心目前来看已经是越来越远了。它不再是最早的一个研究中心,也不是后来说的 ToB 架构,现在 ChatGPT 插件明显是要做 ToC 公司的。这样大家可能对 ChatGPT 的行为和动机安全就产生了怀疑。

李志飞:对,目前 ChatGPT 插件是要把主控程序和入口都放在 OpenAI 这里,而不是说自己作为一个网站调用 ChatGPT 的接口,这个肯定是会让很多人警惕的。

张鹏:用户和平台之间的履约体系我觉得是很难被替代的,但一个中心化入口改变传统互联网格局的可能也是存在的。

张鹏:我们把大模型放在中国商业中,如果ChatGPT有可能成为一个新形态的个人助理,具备各种的能力帮我们解决问题,那微信是不是一个很好的平台去承载这件事情?ChatGPT 的东西,是不是一种小程序的终极状态?

李志飞:微信毫无疑问是最适合来做虚拟个人助理这个东西的。因为它掌握了很多个人信息。但是真正说把这些原始的信息以及背后隐含的抽象的信息都用 ChatGPT 助理总结出来,变成一个对你近乎知根知底的东西,我觉得很多人还是难以接受这个事情。

王俊煜:我觉得不论从产品还是商业的角度,或者其他我们没有想象到的角度,微信都能做成这个事情,并且可能还有很多潜力和可能。

张鹏:微信的商业模型,不论是公众号,视频号还是小程序我觉得都和传统互联网的一些东西不太一样。微信更偏向私域流量,也不限流,流量获取全靠个人努力。所以微信的生态思维还是比较开放的。

张鹏:我们已经看到插件的多种可能,但是有一个问题,就是用户体验的临界值会不会也被击穿?ChatGPT插件多大可能能全面提升用户的使用体验?

王俊煜:大家都知道 ChatGPT 总结的功能非常强大,未来也可能出现类似的插件帮助用户总结朋友圈,视频或者其他东西。虽然说从效率的角度看,工程师和一部分人会大量利用插件将所有的信息尽量整合成类似个人报纸(personalized newspaper)。但是用户花时间刷视频,刷朋友圈这些行为本身更多是一个过程体验,很多时候用户并不想把信息迅速浏览完,用户不需要每件事情都需要一个AI助理。如果真的需要每件事情都用插件来总结,其实就很像三分钟看完一部电影的体验。三分钟看完和花两个小时看完整部电影我觉得完全是两码事。

而且临界值的问题,我觉得有一个使用工具的阈值。比如说用新方法在 70% 的情况下都能比旧方法更简便,但其他 30% 还是原样。这 30% 的情况意味着用户在试完新方法后还需要拿旧方法再做一遍,对于一些人来说还是不能接受这个试错成本的。

张鹏:俊煜提出了一个非常重要的指标,就是说当失败率超过多少之后用户就会放弃使用这项工具。我了解到之前志飞做语音识别的识别率已经能达到 95% 以上,也没有完全对用户语音产品使用产生预期的变革。那到底靠谱程度要到多少才有可能改变之前的用户使用习惯?

李志飞:我之前做 AI 语言产品,会发现即使很多功能已经足够智能,但真正到用户使用那一步,还是会出现很多无法预知的状况,人机交互的方式还是处在初始阶段。比如说语音识别的识别率真的能到 95%,但实际使用中,最后端到端的语音交互体验最后可能就是 60% 甚至更低。

张鹏:所以我觉得对于用户行为没有形成穿透性的改变之前,就是没有真正发生变革。以之前语音产品为借鉴,ChatGPT 使用语音功能的话,它的效果衰退也会有这么严重吗?

李志飞:我觉得如果第一天的产品形态像一个语音助手一样,它的体验度可能就是现在文本对话机器人的 50%。语音助手的整个过程按照我自己的经验来看需要 8 个步骤:降噪,唤醒,语音识别,自然语言理解,对话,搜索,文本生成,文本转语音,这八个步骤中每一步在实际过程都有一定的体验损耗,整体的成功率会出现严重下滑。这些问题对 ChatGPT 的语音功能同样存在。

张鹏:搜索引擎基于大模型的能力到底会怎么变化?它可以不再是一个信息的连接,而是已经能够自身交付解决方式了。如何看待搜索引擎未来的发展可能性?

王俊煜:传统引擎可以用来跳转到一些其它网址,也就是所谓的导向性(navigational)查询。还有一些不跳转到任何网站就回答一些天气、股票、计算器、翻译之类信息类(informational)的问题,这些问题用 GPT 来做显然都没有必要。当然一些比较复杂的信息,ChatGPT可能会在推理这方面做得更好一些。微软 Bing 的 multi-step conversational search(多步对话式搜索)也能够满足一些很复杂的信息检索需求。还有另外一类探索的需求,比如对某一个问题搜索引擎可能会提供很多个解决选项,这非常让用户崩溃,我到底改选哪一个?我觉得 ChatGPT 也并没有很擅长做这种事情。

张鹏:所以能够说大模型的能力用在搜索引擎上,尤其是用在最普遍的搜素需求是有些浪费的吗?

王俊煜:我之前在谷歌的时候,我们的研究团队希望帮助用户构建解决难以构建查询关键词的问题。后来貌似很多方案都是把这些关键词粘到一块,但我总觉得这不是一个最终最佳的方案。

张鹏:如何看待 New Bing?

李志飞:目前搜索引擎有三个步骤:输入、过程、输出。最开始输入的时候用户用的是自然语言,后来逐渐大多数人习惯于用关键词。如果一些搜索需求都是导向性的(navigational),那确实没有多大意义用大模型。

我现在用 New Bing 主要是问一些思考类的,没有确定性答案的问题。有一次我对 GPT 的强化学习、环境这些概念没有十分理解,我用谷歌这些搜索引擎去搜索并没有找到答案,而 New Bing 非常准确地给了我每一个概念的解释。也就是说它像一个人一样可以总结一个答案出来,有时候也会挑战我,我们之间会展开多个回合的拉扯,这样就和搜索引擎是完全不一样的体验。

张鹏:其实也和未来人们的搜索需求息息相关,到底是信息类诉求(informational),还是导向性(navigational),或者事务性的(transactional),三个不同的搜索诉求可能会在未来形成一种新的不论是搜索引擎或者个人助理的方法。


03

不可能停止进步的

大模型何去何从?

张鹏:现在如 Yann LeCun 等科学家提出的一些没有沿着OpenAI大模型路线走的一些模型,是否有追上 GPT 领先优势的可能?

李志飞:GPT 的产品和模型已经跑起来了,就体验上已经领先了其它模型。而且OpenAI已经定义了什么是大模型,什么是大模型的体验,这个时候在一个不确定的情况下再去复制一个一模一样的,是非常难的一件事情。而且 GPT 在这么多资金,这么大算力的支持下,人类已经很难阻止它的继续发展。

张鹏:如何看待最近包括马斯克在内的千人联名呼吁暂停 GPT5 研发这件事情?

李志飞:我觉得这个呼吁既不会产生任何效果,也没有执行暂停研发的路径。所以整个呼吁在我看来是完全没有意义的。最近微软发布的 GPT-4 的论文已经全面展现了 ChatGPT 在语言,逻辑,规划等综合的能力。比如从北京到上海中间有很多城市,很多条路径,要 ChatGPT 写一个程序找出两地之间有多少条路径,而且路径上的公里数可以被 3 除,这种动态规划核心是状态怎么表示,怎么维护,这个算法其实还是很复杂的,一部分学过算法的人可能也没有办法能写出来。从这个角度按理说,AGI 的强大是实实在在的,超出我们绝大部分人类,所以我觉得它带给人类社会的正面价值要远远大于我们马上能看到的风险。潜在的风险我们可以通过法律或者其他手段来解决,但如果把这样一项能给人类带来巨大价值的研究完全停掉,我觉得是不合理的。

目前已经有超过 20000 人签名呼吁停止 AI 研发 | 来源:互联网

王俊煜:这个呼吁是不是也反过来说明 OpenAI 的策略某种程度上遇到了很大的挑战?我看很多人说 OpenAI 变得越来越不 open,会不会是它的某种公关策略或者说形象出现了问题?

张鹏:其实公关的作用远远低于我们的想象,很多事情大家几天就能忘掉,而且很多人也不会因为公关话术就决定用或者不用一个东西。Altman 之前在播客采访中把和马斯克之间的矛盾化解的非常巧妙,所以 OpenAI 不需要任何公关,能做的都做了,说得非常到位。

我觉得现在的它必须要回应的一个问题是,微软现在在 OpenAI 和 GPT 的发展确实有非常强的优先权和独家的商业化数据,AI 如果全部集中在几家头部商业公司里面,这个事情确实比较危险。和微信助理类似,它不是一个商业或者技术逻辑能解决的问题,而是现实人间的逻辑。Altman 说要相信 OpenAI 的初衷即使在微软来势汹汹的商业化战略支持后也没有动摇,他们有自己的信仰,但是真正落到个人身上我觉得并不是百分之百靠谱,这是一个真问题。只不过千人联名这件事情我觉得太水了,更像是一个行为艺术。所以我觉得对 GPT 没有任何公关危机。

李志飞:有关 OpenAI 和微软的联合还造成了很多人对插件的一个担忧是,如果它不再 open,那么所有的内容和服务都变成 OpenAI 的 CP、SP(内容提供商、服务提供商),只能调用 ChatGPT 的接口,这个被让国外很多人警惕的。这个确实对它产生了不少负面影响。

张鹏:客观来讲确实有一部分原因是因为这个东西发展太快了。最初我们都认为这是一个 demo,那一瞬间是让我们最兴奋和震撼的。但是插件发布出来就超过了人们对它会是个产品的预期。现在 GPT2 亿的月活,他们肯定不会放弃在这上面变现或者有更大的野心。但是我们依然能看到 OpenAI 和 ChatGPT 出圈速度太多了,快到没有在大众心目中形成一个固定的形象,对它的组织、文化、价值观、底线这些都不了解。这些在不是很清晰的情况下着实会引发我们的担忧。Plugins 这个东西出来之前,GPT 会被认为是非常聪明的科学家和工程师搞出来的,插件的发布及整个发布策略和时间的选择和一系列连续的操作会让人觉得后面还有一些非常有眼光的商业人士。所以 OpenAI 肯定不是一开始的研究机构了,最终会怎么样,我内心还是存疑的。

张鹏:如何基于大模型训练一个匹配某个特殊领域的模型?这件事情真正要落地需要哪些步骤?复杂度和成本会是什么样子?

李志飞:大模型首先要达到基本的大学生素养,要有一些语言、知识存储、逻辑这些比较通用的能力。然后在此基础上分为两大类,一类是要能上顶尖名校的,比如 DeepMind, OpenAI在做的这些,这种算力,数据,资金投入都是巨大的,这些就不在我们今天讨论的范围之内。另一种大模型是说它具备大学生的水平,但又能满足某个专业的一些特定需求。第二种的投入和难度相对来说更小一些。

张鹏:很多人会问,有没有可能在 ChatGPT 上嵌套一层别的东西,让个性化数据起到更好的作用?

李志飞:这个其实有两种方式。一种就是自己训练一个模型,进行所谓的 fine-tune(微调),这样就是一个完全属于自己的大模型,然后可以做部署或者迭代,它的灵活性是非常高的。

还有一种是基于类似 GPT 这样的大模型,对个性化数据做一个语义检索。也就是类似微软 Office Copilot 这样的事情。具体来说,当用户的查询进来的时候,首先要做的是把数据做一个语义检索,形成一个增强的 prompt 而不是用用户原始的 prompt 塞给大模型。这种就不需要从头训练大模型,只需要调用语义检索的工具和大模型的接口既可以达成。但这种的可控性肯定不如第一种。

张鹏:第二种更像是能够满足 OpenAI 之外的一些商业体,借助 GPT,但又可以做一些有商业壁垒的事情。尤其是一些对产业有认知的人,很有可能率先运用大模型的技术做底层商业的改变。但首先还面临的一个问题是,ChatGPT到底在美国会产生什么样的影响,会不会被反垄断给拦住?如何判断这件事情?

王俊煜:我整体的感觉是,美国对于垄断企业的宽容度比中国要好一些,整体法律环境也比较宽松,绝对意义上更容易去做一些事情。

张鹏:目前像 Yann LeCun 这些科学家也在寻找 GPT 之外的一些路线,OpenAI 和 GPT 领先的优势有可能被追上吗?

李志飞:GPT 产品的落地已经领先很多了,OpenAI 感觉做了比现在公布出来还多的很多东西,这些东西基于 OpenAI 定义的大模型和大模型的体验,所以其他公司要想在不确定情况下复制一个一模一样的,是非常难的。而且 1 个月前发布的 GPT4 实际上是去年 10 月份就已经训练好的,加上微软投的 100 亿美元,很难不让人相信 GPT5 已经处在大力发展的过程中。而其他比较成型的模型,比如谷歌的 Bard,其实还是在追赶去年 5 月训练完成,11 月发布的 GPT3.5。因此至少半年内很难看到说技术进步有被拖住的可能。




关注 Founder Park,我们将持续推出更全面更深度的大模型相关讨论与报道。

如果你有投身大模型创业的想法,欢迎加入我们的大模型相关领域交流群,来一起探讨大模型时代创业的共识和认知。

长按识别二维码填写入群申请表

关于交流群:

在 ChatGPT 发布后,我们迎来了一个全新的创业时代,似乎又回到了移动互联网早期——大量产品的方向和定义还不清楚的时代,我们希望把更多愿意思考和有创业意向的人聚集在一起,连接更多大模型领域的 doer(实干家),让更多有价值的认知在这里流动、碰撞、凝结,孵化出更多优秀的产品和项目。

Founder Park 计划搭建一个大模型相关领域的交流社区,面向有志于在大模型相关领域创业的创业者、产品经理、工程师、学者及投资人,围绕大模型相关创业的新项目、新赛道进行交流探讨。

在这里,你可以获得大模型相关领域的最新动态、高质量的对话交流,结识更多高净值的创业人群,同时,极客公园也会为优秀的项目提供资金、人才及其他资源的支持。




更多阅读
王小川投身大模型,思路是什么?他会怎么做?
A16Z:AIGC的行业应用,从生成式到合成式
OpenAI 首席科学家 Ilya Sutskever:AGI 提供的是人类自我进化的安全保障
ChatGPT 发布后,马斯克老师的 100 条迷思

张鹏对话李志飞:大模型不只 OpenAI 一种做法,未来中国可能会有 50 家大模型



转载原创文章请添加微信:geekparker

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存